今天接續昨天的modern neural network
問題一:What is important when creating deep neural networks?
答案為:
Lots of data : 有足夠多的data才能保證deep model中的參數可以被訓練完全.並且在predict上能夠成功,如果data不足很可能你只是在overfit小部分的data,當你遇上從沒看過的data時predict就會失敗
Having good generalization: 你可以使用ensemble的概念->drop out.增加data noise...等等方法來達到好的泛化
Experimentation: 最後重要的一點,在ML中有太多網路模型,演算法,如何創造資料,參數調控等等各式各樣的細節.沒有人可以確切知道使用哪些搭配在訓練上會是最好,而且每個人要達到的任務也不同,因此ML DL 是非常實驗性的, you need to try!
有一題題目如下:
You own a winter ski resort and want to predict the traffic levels of ski runs based on four types of customers (beginner, intermediate, advanced, expert) that have bought tickets and the amount of previous snowfall.
在這個題目中,你可以試著想想看這種情況看你是否具有定義問題的能力與知道該收集甚麼樣的data,在ML中定義問題是全部開始的第一步,要知道目標才有收集data的方向,最後才決定選用甚麼網路模型,使用甚麼技巧等等,training的過程反而不如想像中重要,如同之前提的:很多時候project的fail來自於data收集與處理, all based on data,因此這部分可以好好練習.
我很粗糙的隨意想一下:
If I want to classify the traffic levels to high, medium, and low classes, I will collect data first.
The data will be the number of people who use ski runs based on their levels.
Second, I will build up the model. The model will be a deep neural network.
Last, I just adjust the model and use the validation set to exam the output.
我認為抓住大方向,並且平時多想想看或許可以想到別人沒想過的問題!
明天開始Module 2,預計利用假日多看一點! 即使是假日也不可以鬆懈下來!加油